草庐IT

python shuffle算法性能

全部标签

c++ - 最佳 GPU 性能的理想位图大小?

我知道在处理显卡时,需要提供2的幂位图。1,2,4,8,16,32...我打算制作一个基于图block的项目,只有我需要知道向显卡提供巨大的位图是否有任何限制。使用小/大位图的优点/缺点是什么?我应该使用更合适的位图大小吗? 最佳答案 一般来说,在处理现代GPU时,数据量越大越好。你没有说你正在使用什么API(OpenGL、CUDA等),但你可以这样想:chunk_time=overhead_time+(num_of_elements/num_of_chunks)*per_element_timetotal_time=chunk_t

c++ - 用于测试路径查找算法的可能数据集

我正在做一些关于寻路的工作。到目前为止,我已经在由2D单元组成的场景上测试了我的代码。我还创建了一个简单的3d场景来测试我的工作。我想在一些3d场景上测试我的作品..但是创建它们很耗时。有人知道我可以用来测试我的寻路算法的任何场景数据集吗? 最佳答案 要获得更好的答案,您确实需要指定要考虑的配置空间的维数。您不会通过离散图搜索来解决蛋白质折叠和对接问题(200多个自由度)。即使是一个相对较小的规划问题(就学术问题而言),大约6个自由度也会很快变得棘手。大多数最好的规划示例往往首先发表在研究论文中,然后才被广泛使用。一些最好的工作往往

c++ - C++ 性能技术报告 TR 18015 中使用了哪些实现?

在TechnicalReportonC++Performance有很多表格比较了C++的不同实现。不幸的是,没有提到所使用的操作系统和编译器。我想知道这些信息是否可以通过非官方方式获得,或者至少可以从技术报告本身中推断出来。 最佳答案 从报告的第23页开始:“大多数关于运行时成本的评论都是基于一组简单的测量,这些测量是在三种不同的机器架构上使用六种不同的编译器执行的,这些编译器使用各种优化选项运行.每个测试都运行多次以确保结果是可重复的.代码在附录D中给出:.这些测量的目的既不是为了获得C++在给定机器上的最佳性能的精确陈述,也不是

c++ - Mac OS X 上的高性能代码

我想知道在OSX上分析应用程序代码的最佳方法。我有一个纳秒分辨率计时器,经过一些基线测试后,我似乎遇到了大约45微(macbook2ghz)的内核系统调用上下文切换core2双核模型)。我注意到,如果我不时地让我的应用程序循环,我可以获得大约25,000-50,000微次的调度上下文切换。我正在测试一些算法,我想限制它的影响。我真正想要的是能够设置任务的处理器亲和性,并将主线程优先级设置为实时,这不是一件坏事,因为有一天这台Macbook可能会用作低延迟Controller为了某件事。关于如何在雪豹/XCode上执行此操作的任何想法? 最佳答案

c++ - 在 std::list 中合并(将两个项目融合在一起,用融合替换它们)项目的算法(即破坏性聚类)

抱歉,如果这很明显,我是C++的新手。stackoverflow上似乎有相关的答案,只是我所理解的不足以适用于我的情况。我有一个代表视觉补丁的类实例列表。当特征之间的距离低于阈值时,我想合并这些项目,用合并后的输出替换parent。像这样:使用嵌套for循环遍历所有项目(将每个项目与其他所有项目进行比较)当找到匹配项时(不是同一个实例):从匹配对构造一个新的(子)实例,附加到新列表。从列表中删除两个(父)项继续遍历列表以查找其他匹配项将新列表附加到原始列表。我知道如何使用迭代器在单个for循环中从列表中删除项目,但我不清楚它如何在嵌套循环中工作,因为erase()递增到下一个项目。我可

【Android】性能优化之内存、网络、布局、卡顿、安装包、启动速度优化

欢迎来到Android开发老生常谈的性能优化篇,本文将性能优化划分为内存、网络、布局、卡顿、安装包、启动速度七块,从这七块优化出发,阐述优化的Application的方式。目录内存优化避免内存泄漏使用内存分析工具优化数据结构和算法数据缓存避免频繁的GC网络优化合并接口请求,减少请求次数使用网络缓存使用合适的数据格式使用合适的网络库后台同步预加载使用持久连接优化图片加载使用前检测网络布局优化1、减少布局嵌套2、减少wrap-content的使用3、使用include、merge、ViewStub,重复布局复用卡顿优化造成卡顿的原因主线程阻塞内存泄漏布局过于复杂Bitmap对象过大频繁的GC动画效

c++ - 提高 dpll 算法的性能

我正在用C++实现一个DPLL算法,如wikipedia中所述。:functionDPLL(Φ)ifΦisaconsistentsetofliteralsthenreturntrue;ifΦcontainsanemptyclausethenreturnfalse;foreveryunitclauselinΦΦ←unit-propagate(l,Φ);foreveryliterallthatoccurspureinΦΦ←pure-literal-assign(l,Φ);l←choose-literal(Φ);returnDPLL(Φ∧l)orDPLL(Φ∧not(l));但表现糟糕。在这

c++ - 顶点着色器的定点算法

如果我使用定点(或描述最小游戏单元的1的整数)来描述我的顶点vector,我如何设置OpenGL/特征转换来使用它?如果我在我的顶点着色器中这样做:gl_Position=projectionMatrix*viewMatrix*modelMatrix*vec4(in_Position,1.0)如果我将in_Position作为GL_INT的vec3传入,而我将矩阵作为GL_FLOATmat4传入,是否会进行正确的转换?有性能成本吗?是否可以将我的转换矩阵也设置为定点?这是通过2D游戏完成的,我认为这比3D游戏更可行。我真的更喜欢准确性,因为当事物远离原点时,大map上的位置似乎会下降。

c++ - 在字典中查找单词模式,高性能

我需要构建某种字典,其中还包含每个单词在该语言中出现的单词频率。通常,这将使用std::unordered_map来实现,对吧?现在问题来了……我想找到所有符合某些正则表达式的单词及其频率,而性能是我最关心的问题。我不认为我将能够避免迭代一系列元素并逐元素检查它们是否与模式匹配。因此,我认为使用一对vector而不是map可能更聪明:usingnamespacestd;typedefvector>Dictionaryvectorindex;Dictionarydict;...for_each(index['d'],index['e'],DoSomething);这将使我能够有效地遍历所

c++ - 用 Chudnovsky 算法计算 Pi 数

下面是一些根据Chudnovsky算法计算Pi的C++代码:#include#include#includeintfact(intdigit){intresult=1;for(inti=digit;i>1;i--){result*=i;}returnresult;}intmain(){longdoublepi=0.0;intprecision=10;for(intk=0;k问题是此代码仅返回PI编号的右15位数字,另一部分是垃圾...当精度变量设置为12或更大时,它返回-nan。有人可以帮我吗?TIA编辑:Ubuntu12.10x64,gcc4.7.2 最佳